СПОСОБЫ ЗАДАНИЯ РАССТОЯНИЙ НА СТРУКТУРИРОВАННЫХ ОБЪЕКТАХ, ОПРЕДЕЛЕННЫХ ЧАСТИЧНО ЗАДАННЫМИ
ФОРМУЛАМИ
А.А. Викентьев, Л.Н. Коренева
Институт математики СО РАН, Новосибирск, Россия
Abstract — In this work the structural objects are considered. This objects can be determined as partly given formulas. By making use of the methods of mathematical logic and model theory we suggest the way of determining the distance between the structural objects and the quantitative measure of information of objects. In work we study the properties of entered distances.
Введение
В распознавании образов и создании экспертных систем большую роль играют структурированные объекты и информация о них, полученная от экспертов. Эта информация может быть представлена в виде списка логических высказываний экспертов, записанных в виде формул.
Высказывания различаются по количеству содержащейся в них информативности, и, следовательно, возникают задачи согласования высказываний.
При согласовании высказываний особую роль приобретает вопрос введения метрики на высказываниях экспертов и количественной меры информативности высказываний.
В работе рассматриваются частично заданные высказывания экспертов, предлагаются способы задания расстояний и меры информативности на структурированных объектах. Изучаются свойства введенных расстояний.
Зафиксируем язык первого порядка
Имеется конечное число экспертов. Каждый эксперт дает свою интерпретацию символам языка в соответствующие частичные отношения (предикаты) на множестве
Обозначим через
Вместо частично заданного экспертом предиката
Введем расстояние между высказываниями (предикатами) на множестве частично заданных моделей
Определим расстояние между формульными подмножествами (предикатами) в каждой модели
Определение1
. Расстоянием между предикатами
Замечание. Если рассматриваемые предикаты имеют разную арность, т.е. эксперт не высказывается о значении некоторой характеристики, тогда полагаем, что эта характеристика является пустым множеством.
Расстояние между предикатами на всем семействе моделей
Определение2
. Расстоянием между предикатами
Далее, для простоты обозначений, знак
Теперь рассмотрим способ определения расстояния между предложениями.
Обозначим через
Очевидно, существуют такие модели, на которых не тавтологичное предложение истинно, и такие, на которых оно ложно. Естественно измерять различие информации, содержащейся в предложениях, количеством моделей, на которых предложения принимают разные значения истинности.
Определение3
. Расстоянием между предложениямиРассмотрим еще один способ определения расстояния между формулами. Дополним язык
При подстановке кортежей в формулы, в предположении, что формулы имеют одинаковую местность (как этого добиться, было показано выше), формулы становятся предложениями.
Определение4
. Расстоянием между формулами.
Доказана теорема, из которой следует, что предложенные расстояния действительно являются метриками. В теореме доказаны и некоторые дополнительные свойства введенных расстояний.
Теорема1
. Для любых формул1.
2..
3.Если
.
4.
5.
6.
7.
8..
9. .
С точки зрения важности информации, сообщенной экспертом, естественно считать, что информативность высказывания тем выше, чем меньше моделей (или мера), на которых оно выполнимо, поэтому введем информативность следующим образом.
Определение5. Пусть
, где 1 -- тождественно
истинный предикат.
Теорема2. Для любых формул ,
1.
2.
3. .
4.
5.
6.
7.
8. Если
9. Если
то
10.
11.
Часто неизвестен точный размер области
определения, известно только, что
большое. Поэтому имеет смысл изучать
асимптотическое поведение расстояния между
высказываниями экспертов при устремлении
к бесконечности. Зависимость расстояния
от
дальше будем обозначать
через
. По поводу
асимптотического исследования в этом случае
получены следующие результаты.
Теорема3. Если и
высказывания экспертов, записанные как
предложения языка первого порядка, состоящего
только из предикатных символов, тогда
а) сходится к 0 или 1 при
б) Если одно из высказываний и отрицание другого принадлежат некоторой полной непротиворечивой теории (множеству предложений), то
в) Если оба этих высказывания либо их отрицания принадлежат некоторой полной непротиворечивой теории, то
г) Если вместо множества всех моделей рассматривать подмножество, содержащее по одному представителю каждого изоморфного типа моделей исходного множества, то асимптотическое поведение расстояния между высказываниями экспертов, не меняется.
Для представления логических решающих функций распознавания образов и экспертных систем используются деревья решений (структурированные объекты).
Пусть задан
исходный набор переменных с
областями значений
и
,
-набор значений переменных
для объекта
. Пусть
-дерево
решений, разбивающее множество объектов
на
образов.
Из определения дерева решений [1] следует, что для любого
; для
,
и каждое дерево решений
дает:
1) Разбиение
множества на попарно
непересекающиеся подмножества
, где
,
;
,
;
(набор переменных, по
которому строится каждая ветвь дерева, может
быть произвольным);
Замечание
: если нескольким путям, ведущим от корня дерева к висячей вершине, соответствуют области2) Значения образов (классов)
3) Каждому пути от корня дерева к висячей вершине соответствует формула
Замечание
: если формулы4) Дереву
Пусть
Замечание
: ФормулыТогда расстояние между деревьями решений определим следующим образом.
Определение6
. Расстоянием между деревьямиЭто расстояние также является метрикой и удовлетворяет всем утверждениям теоремы 1.
С точки зрения наилучшего
разбиения множестваОпределение7. Пусть
Теорема4. Для любых деревьев решений
1.
2. , (1- дерево решений с одним
классом в случае
).
3., (имеет смысл только для
двух классов).
4. Если =
(совпадение деревьев в смысле разбиений и
значений образов), то
.
5. , (пересечение и объединение
деревьев по подмножествам, определяющим один и
тот же образ).
6. Если ,
то
.
Работа проделана частично при поддержке гранта РФФИ № 980100673 и программы
‘’Интеграция’’.Литература
Site of Information
Technologies Designed by inftech@webservis.ru. |
|